Analise Preparação de Dados

Dataset: CSGO Winner

Nome do arquivo: csgo_round_snapshots.xlsx

o Fonte: https://www.kaggle.com/christianlillelund/csgo-round-winner-classification

o Contexto: este dataset contém o resultado de 122 mil momentos que aconteceram durante mais de 700 partidas de campeonatos de alto nível do jogo Counter-Strike: Global Offensive. Temos dados como, por exemplo, o arsenal de ambas as equipes (CT e T), o dinheiro disponível para as duas equipes, o mapa, entre outros. A ideia é prever o vencedor da partida (round_winner).

Mapa de Calor - Valores Nan

Total de Linhas na Base

Limpar e Normalizar os dados

Padronização de CT e T

Resolvi que para andar com o processo de analise exploratoria, preciso formatar os dados de string para tipos inteiros,usei um metodo de aplicação de apply para remover tudo que for string ct para 0 e T para 1, quero ver como é o comportamento do processo de t_score tambem, como ele se comporta em relação ao quantidade total por partida

Automação Exploração de Dadaos (sweetviz)

Percepções

PS: Percebi que usando sweetviz poderia automatizar o processo de EDA, poderia ter uma visualização mais completa olhando para todos os pontos que tive no começo, acredito que dessa forma, pouco tempo no processo de descobertas, com essa tecnica consigo entrar mais no detalhe e ter a percepção que o padrão das partidas variam de acordo com time e em relação a vida,dinheiro, tipo de arma, e classificação de ct ou t.

Observação sobre ct_defuse_kit

Percebi que o grafico de barras apresenta uma distribuição em barras com os seguintes dados

TOP CATEGORIES
042 09534%
127 40022%
217 21814%
315 38613%
412 01310%
58 2987%

Mapeamento coluna Map

Para prosseguir com a base preciso mapear e converter a coluna map para um tipo string para isso mapei os index usando groubpy e em seguida usei a funcção do apply para fazer as trocas.

Gerando Base para Treino